Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

benspx Abonné

Le 25/04/2024 à 14h49

#1

D’après SemiAccurate, Qualcomm a pipé les benchs, et les OEM n’atteindraient en situation réelle que 50% des perfs promises par Qualcomm :

https://www.semiaccurate.com/2024/04/24/qualcomm-is-cheating-on-their-snapdragon-x-elite-pro-benchmarks/

Si cela est avéré, c’est encore un moment « PC on ARM » qui fera pschit …

dvr-x Abonné

Le 25/04/2024 à 16h28

#2

Comme tout système ouvert, Windows est sur un vrai défi.. Déjà abandonner le 32b en était un, mais passer sur ARM sera encore plus complexe.
Il y a tellement d’applications et d’éditeurs sur Windows que la marche forcée (un peu en mode Apple) n’est pas vraiment possible.

Pondre un ultrabook, en ARM qui est juste destiné à faire du Office et Web principalement (donc sur des applis ARM), on devrait quand même arriver vite à de bonnes perfs et une bonne autonomie. Je suis curieux de voir ces Snapdragon dans une machine.
Le temps d’arriver à un émulateur X86 performant par contre je doute que ce soit si simple, aussi puissant soit les processeurs ARM. A mon avis Windows va avoir le c entre deux chaises un très long moment…

Ce serait intéressant d’avoir une notion de tarifs, je sens bien le prix moins élevé qu’un i7 mais la machine 2 fois plus cher à l'achat

Wosgien Abonné

Le 25/04/2024 à 17h11

#2.1

Des émulateurs déjà pas trop mal il y en a (genre fex-emu).

Mais un problème sous-jacent, c'est que pour le moment sans extension spécifique, émuler un x86 nécessite d'utiliser des pages de 4ko de mémoire.
Or, c'est aussi contre performant actuellement.

Donc:
* soit on peut émuler du x86
* soit on gagne (jusqu'à 15%) en perfs.

fred42 Abonné

Le 25/04/2024 à 17h25

#2.2

Wosgien

Des émulateurs déjà pas trop mal il y en a (genre fex-emu).

Mais un problème sous-jacent, c'est que pour le moment sans extension spécifique, émuler un x86 nécessite d'utiliser des pages de 4ko de mémoire.
Or, c'est aussi contre performant actuellement.

Donc:
* soit on peut émuler du x86
* soit on gagne (jusqu'à 15%) en perfs.

J'ai du mal à comprendre ton affirmation.

On parle ici d'émuler un du x86 non pas pour faire tourner un OS dessus mais simplement une application. J'ai l'impression que les pages de 4ko sont un non sujet ici, mais il y a peut-être un truc qui m'échappe. Pour moi, la gestion des pages, c'est l'OS qui le fait avec la gestion de la MMU et ensuite des exceptions qui font charger la page si les données ne sont pas en mémoire. Une application ne gère pas elle-même la pagination et donc l'émulateur n'a donc pas non plus besoin de la gérer.

BlackLightning Abonné

Le 25/04/2024 à 18h49

#2.3

fred42

J'ai du mal à comprendre ton affirmation.

On parle ici d'émuler un du x86 non pas pour faire tourner un OS dessus mais simplement une application. J'ai l'impression que les pages de 4ko sont un non sujet ici, mais il y a peut-être un truc qui m'échappe. Pour moi, la gestion des pages, c'est l'OS qui le fait avec la gestion de la MMU et ensuite des exceptions qui font charger la page si les données ne sont pas en mémoire. Une application ne gère pas elle-même la pagination et donc l'émulateur n'a donc pas non plus besoin de la gérer.

Une application peut demander recourir à des pages plus grandes sur l'x86_64 tel que 2 MiB et 1GiB par exemple. Évidemment l'OS doit pouvoir gérer ces situations.
Sous Linux : Huge Page.

En pratique, quand j'ai besoin, j'utilise mmap et madvise. L'intêret est de ces grandes pages est de pouvoir réduire la pression sur le TLB, un cache mémoire en charge de faire le lien entre mémoire virtuelle et physique. Pour certaines applications (notamment BDD, traitement de fichiers de grands volumes ou encore calculs), ce genre d'optimisations permet d'améliorer les performances de, facilement, quelques dizaine de pourcents comme indiqué par @Wosgien.

Modifié le 25/04/2024 à 18h50

Historique des modifications :

Posté le 25/04/2024 à 18h49

Une application peut demander recourir à des pages plus grandes sur l'x86_64 tel que 2 MiB et 1GiB par exemple. Évidemment l'OS doit pouvoir gérer ces situations.
Sous Linux : Huge Page.

En pratique, quand j'ai besoin, j'utilise mmap et madvise. L'intêret est de ces grandes pages est de pouvoir réduire la pression sur le TLB, un cache mémoire en charge de faire le lien entre mémoire virtuelle et physique. Pour certaines applications (notamment BDD, traitement de fichiers de grands volumes ou encore calculs), ce genre d'optimisations permet d'améliorer les performances de, facilement, quelques dizaine de pourcents.

Wosgien Abonné

Le 25/04/2024 à 22h49

#2.4

fred42

J'ai du mal à comprendre ton affirmation.

On parle ici d'émuler un du x86 non pas pour faire tourner un OS dessus mais simplement une application. J'ai l'impression que les pages de 4ko sont un non sujet ici, mais il y a peut-être un truc qui m'échappe. Pour moi, la gestion des pages, c'est l'OS qui le fait avec la gestion de la MMU et ensuite des exceptions qui font charger la page si les données ne sont pas en mémoire. Une application ne gère pas elle-même la pagination et donc l'émulateur n'a donc pas non plus besoin de la gérer.

Tu parles du cas de la recompilation d'appli. Mais en général la recompilation d'appli s'accompagne de la recompilation des librairies qu'elle charge.
Ces librairies peuvent être assez bas niveau.

Il y a des applis "bateau" qui peuvent être recompilées sans problème, mais elles sont très rares. Même des librairies XML ont du mappage de fichier en RAM, ce qui nécessite un accès à l'OS. Et beaucoup sont compilées avec des limites de 4ko "en dur", tout simplement parce que la taille de page est indiquée dans les scripts de compilation (en se disant que si on devait aller sur un autre OS, il "suffirait" de recompiler).

La plupart des émulateurs haut-niveau ont tout de même un lien fort à l'OS, ou alors il faut réécrire tous les appels - et même là, rien n'est garanti, on peut facilement tomber sur un bout de code qui alloue 4ko et détecte de lui-même les exceptions lors d'un dépassement de page (anti-virus ... anticheat?)

Et détecter les dépassement de page "à la main" parce que le système a des pages plus grandes est très coûteux.

Bref, sans des pages de même taille, ou sans un CPU qui peut gérer en même temps des pages de 4k et 16k/64k, aucune garantie possible de compatibilité des softs.

cmoifranck Abonné

Le 26/04/2024 à 06h49

#3

Après lecture des commentaires, et bien, j'ai pas compris.
Quelqu'un a une ou des vidéos qui vulgarise bien l'interaction cpu, os, pages, mémoire, (et un peu compilation, mais sur ce dernier, je commence à être en terrain connu) ? Siouplé :)

Wosgien Abonné

Le 26/04/2024 à 11h22

#3.1

Il faut regarder comment la mémoire virtuelle est gérée. Et côté CPU, regarder ce qu'est le TLB.

En fait, l'OS présente un espace mémoire à chaque appli. Cet espace mémoire semble contigu, mais l'OS le découpe en morceaux de 4k (lié à ce que le CPU sait gérer). Chaque fois que l'application veut lire en mémoire, il faut vérifier dans quel morceaux de 4k cela tombe, si ce morceaux est en mémoire ou sur le disque, si l'application a le droit d'y lire, écrire, ...

Donc quand on parcourt un tableaux, tous les 4k l'appli est interrompue pour que l'OS vérifie tout cela, fasse en sorte que la mémoire soit là, ...

Quand on fait du traitement de données et qu'on tape partout dans la RAM, on est interrompu plein de fois, mais heureusement le CPU a des mécanismes pour que les pages les plus récentes soient plus rapides à accéder.

C'est normalement transparent pour une appli lambda.

Le problème, c'est que 4ko, c'est trop juste maintenant. On a des mécanismes pour avoir des pages plus grandes, mais c'est très spécifique à certaines applis et ça demande de taper dans l'OS: on est moins portable.

Une solution serait de passer à des pages de 16ko, 64ko. C'est possible sur certains ARM, à ma connaissance pas sur PC, et c'est déjà un boost pour le traitement (y compris pour le javascript).

Par contre, quand on fait de l'émulation, certaines fonctionnalités pointues sont liées à ces pages, et les limites sont souvent compilées dans le code, impossibles à retrouver. Donc un soft très optimisé comme un jeu, une BDD, risque de ne pas fonctionner sur un OS dont les pages sont de taille différente.
Emuler la détection de ces limites est extrêmement coûteux (cela revient à checker logiciellement chaque accès mémoire...)

Pour résumer:
* Un passage du x86 à l'ARM avec la même taille de page: on peut émuler sans trop se poser de questions
* Un passage du x86 à l'ARM avec un taille de page inférieure: on peut émuler sans trop se poser de questions, mais on perd en perfs
* Un passage du x86 à l'ARM avec un taille de page supérieure: on peut émuler des trucs simples ... mais il y a des limites, des risques, mieux vaut se focaliser sur le natif et les runtimes type Java/C#

cmoifranck Abonné

Le 27/04/2024 à 12h57

#3.2

Wosgien

Il faut regarder comment la mémoire virtuelle est gérée. Et côté CPU, regarder ce qu'est le TLB.

En fait, l'OS présente un espace mémoire à chaque appli. Cet espace mémoire semble contigu, mais l'OS le découpe en morceaux de 4k (lié à ce que le CPU sait gérer). Chaque fois que l'application veut lire en mémoire, il faut vérifier dans quel morceaux de 4k cela tombe, si ce morceaux est en mémoire ou sur le disque, si l'application a le droit d'y lire, écrire, ...

Donc quand on parcourt un tableaux, tous les 4k l'appli est interrompue pour que l'OS vérifie tout cela, fasse en sorte que la mémoire soit là, ...

Quand on fait du traitement de données et qu'on tape partout dans la RAM, on est interrompu plein de fois, mais heureusement le CPU a des mécanismes pour que les pages les plus récentes soient plus rapides à accéder.

C'est normalement transparent pour une appli lambda.

Le problème, c'est que 4ko, c'est trop juste maintenant. On a des mécanismes pour avoir des pages plus grandes, mais c'est très spécifique à certaines applis et ça demande de taper dans l'OS: on est moins portable.

Une solution serait de passer à des pages de 16ko, 64ko. C'est possible sur certains ARM, à ma connaissance pas sur PC, et c'est déjà un boost pour le traitement (y compris pour le javascript).

Par contre, quand on fait de l'émulation, certaines fonctionnalités pointues sont liées à ces pages, et les limites sont souvent compilées dans le code, impossibles à retrouver. Donc un soft très optimisé comme un jeu, une BDD, risque de ne pas fonctionner sur un OS dont les pages sont de taille différente.
Emuler la détection de ces limites est extrêmement coûteux (cela revient à checker logiciellement chaque accès mémoire...)

Pour résumer:
* Un passage du x86 à l'ARM avec la même taille de page: on peut émuler sans trop se poser de questions
* Un passage du x86 à l'ARM avec un taille de page inférieure: on peut émuler sans trop se poser de questions, mais on perd en perfs
* Un passage du x86 à l'ARM avec un taille de page supérieure: on peut émuler des trucs simples ... mais il y a des limites, des risques, mieux vaut se focaliser sur le natif et les runtimes type Java/C#

Ok c'est plus clair, merci :)

MisterDams Abonné

Le 26/04/2024 à 08h37

#4

Ça sent la déception ces Snapdragon X Elite Plus Pro Deluxe 2000-42. On nous a vanté le talent d'être supérieur au M3, sauf que c'est clairement l'ultra haut de gamme qui se confronte à l'entrée de gamme, et avec des performances pas forcément aussi impressionnantes que ne le prétendent les annonces.

Reste à voir l'approche tarifaire qu'il y aura autour, mais à mon avis il va pas falloir qu'ils s'emballent trop pour pas que tout ça parte en échec commercial.

fofo9012 Abonné

Le 28/04/2024 à 10h36

#5

On a des infos concernant l'(/la non-)ouverture de ces snapdragons, a-t-on des pilotes open source ? Voir un support noyau Linux ? Comment s'en sort gcc avec cette archi ?

Si oui c'est là où ça va causer, sous Linux (ou tout soft open source en général) il suffit de recompiler, pour avoir les perfs optimales.

Triton Abonné

Le 28/04/2024 à 13h06

#5.1

Il y a des pilotes open source pour un certain nombre d’éléments (la micro-architecture* ARMv8 est publique donc GCC et consorts s’en sortent sans problème, la partie graphique est basée sur l’architecture Radeon—dont Adreno est une anagramme—donc il y a peut-être quelque-chose aussi) mais il reste beaucoup d’éléments qui n’ont aucune solution open source.

C’est d’ailleurs une des raisons qui entraîne la fin du support des téléphones Android : puisque le pilote n’est pas mis à jour, il n’est pas possible de passer sur le noyau plus récent de la nouvelle mouture (les ROM alternatives trafiquent souvent Android pour le faire tourner avec l’ancien noyau).

C’est aussi pour ça que Fairphone n’a pas choisi un processeur Snapdragon pour son numéro 5 mais une version destinée à l’IoT/l’industrie pour avoir un support plus long.

(*) Pas certain que ce soit le bon terme, les sachants peuvent corriger.

Modifié le 28/04/2024 à 13h09

Historique des modifications :

Posté le 28/04/2024 à 13h06

Il y a des pilotes open source pour un certain nombre d’éléments (la micro-architecture ARMv8 est publique donc GCC et consorts s’en sortent sans problème, la partie graphique est basée sur l’architecture Radeon—dont Adreno est une anagramme—donc il y a peut-être quelque-chose aussi) mais il reste beaucoup d’éléments qui n’ont aucune solution open source.

C’est d’ailleurs une des raisons qui entraîne la fin du support des téléphones Android : puisque le pilote n’est pas mis à jour, il n’est pas possible de passer sur le noyau plus récent de la nouvelle mouture (les ROM alternatives trafiquent souvent Android pour le faire tourner avec l’ancien noyau).

C’est aussi pour ça que Fairphone n’a pas choisi un processeur Snapdragon pour son numéro 5 mais une version destinée à l’IoT/l’industrie pour avoir un support plus long.

Catégories

Nous suivre

À propos

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Et voilà le Snapdragon X Plus

Sommaire de l'article

Introduction

Et voilà le Snapdragon X Plus

Trois variantes du Snapdragon X Elite

Quelles performances et autonomie ?

Quel type d’appareil ?

#Flock vous dit adieu

Plantage des Core i9 (13e et 14e gen) : réactions et recommandations officielles d’Intel

La vidéosurveillance dans les chambres des EHPAD réservée aux suspicions de maltraitance

Face à des résultats mitigés, Apple agite 110 milliards de dollars

Les écrans, du temps perdu pour les enfants ?

L’e-commerce européen pâtit de la concurrence de la fast fashion chinoise et du commerce social

App Store et sideloading : Apple revoit sa copie sur les commissions

Play2 : Sunology passe à 450 watts (jusqu’à 585 watts en bi-face) pour son kit solaire

55 ans d’AMD : des clones Intel au succès de Zen

Vidéosurveillance algorithmique : la Quadrature du Net dépose plainte devant la CNIL

Commentaires (12)

Historique des modifications :

Historique des modifications :